ردیابی شی در تصاویر ویدیویی

پایان نامه
چکیده

بینایی ماشین با ترکیب روش های مربوط به پردازش تصویر و ابزارهای یادگیری ماشینی، رایانه را قادر به درک هوشمند معنا و محتوای تصاویر می کند. ردیابی شی یک عمل اساسی برای بسیاری از کاربردهای سطح بالای بینایی ماشین مانند بازشناسی براساس حرکت، نظارت خودکار، نمایه گذاری فایل های ویدیویی، ارتباطات متقابل انسان و رایانه، نظارت ترافیکی و هدایت وسایل نقلیه است که امروزه در بالاترین سطح توجه خود قرار دارد. در این پایان نامه الگوریتمی کارا جهت ردیابی شی در تصاویر ویدیویی با استفاده از ویژگی های رنگ و بافت و به کمک دو شبکه عصبی توابع اساسی شعاعی ارائه شده است. در روش پیشنهادی ابتدا ناحیه ی شی توسط کاربر در فریم اول مشخص می گردد. سپس ناحیه ای هم مساحت با آن و در اطراف آن بعنوان زمینه در نظر گرفته می شود. پس از آن ویژگی های رنگ و بافت از نواحی شی و زمینه استخراج شده و به شبکه عصبی توابع اساسی شعاعی اول آموزش داده شده و آزمایش می شود. خروجی شبکه عصبی اول تصویر دودویی خواهد بود که در آن شی از زمینه ی اطرافش بطور دقیقی جدا شده است. سپس ویژگی های رنگ و بافت ناحیه ی دقیق زمینه ی بدست آمده از مرحله ی قبل گسترش داده می شود تا بتواند در برابر تغییرات زمینه در فریم های بعدی مقاوم گردد. در ادامه از ویژگی های شی و زمینه ی گسترش داده شده برای آموزش شبکه ی عصبی توابع اساسی شعاعی دوم استفاده می گردد. از شبکه عصبی توابع اساسی شعاعی آموزش داده شده ی دوم بعنوان یک تابع امتیاز دهی استفاده می گردد که مقادیر بیشتر در آن بیانگر بالاتر بودن احتمال تعلق آن پیکسل به شی است و از آن برای تشخیص پیکسل های شی در فریم بعد استفاده شده است. در روش پیشنهادی از مرکز ثقل شی و پروسه ی جابجایی میانگین برای مکان یابی شی استفاده شده است. از آنجا که بافت و رنگ شی و پس زمینه در طول ردیابی و در فریم های بعدی یکسان باقی نخواهد ماند با معرفی و سنجش معیارهایی تغییرات در مدل و اندازه ی شی بروز رسانی می گردد. نتایج بدست آمده بیانگر این است که روش پیشنهادی قابلیت ردیابی مطمئن شی را با دوربین متحرک و با وجود پوشیدگی های جزئی شی و تغییرات تدریجی در رنگ و بافت شی و زمینه خواهد داشت و تغییرات در اندازه ی شی را نیز بخوبی جبران می کند. همچنین نتایج بیانگر این است که روش پیشنهادی عملکرد بهتری در مقایسه با روش های جابجایی میانگین و تطابق قالب دارد. علاوه بر این، روش پیشنهادی ناحیه ی اشغال شده در هر فریم توسط شی را فراهم می کند که از آن می توان در پردازش های مرتبه بالاتر مانند تشخیص، تعبیر و تفسیر نوع رفتار شی و نظایر آن استفاده نمود.

منابع مشابه

ردیابی شی های متعدد در تصاویر ویدیویی با استفاده از الگوریتم کرم شب تاب

بیش از سه دهه است که در زمینه ردیابی شی تحقیقات متعددی صورت گرفته است. اما با معرفی کاربرد¬های جدید برای این شاخه از بینایی ماشین رویکرد¬های مختلفی برای آن معرفی شده است. پژوهش صورت گرفته در این پایان نامه منجر به ارائه یک روش جدید برای ردیابی چندین شی به صورت همزمان شده است. در ساختار ردیاب پیشنهادی، از الگوریتم fsim، برای استخراج مدل اشیا استفاده شده است. اشیا قبلا بصورت ساده و توسط اشکال ساد...

رخدادکاوی در دنباله تصاویر ویدیویی مبتنی بر مدلسازی شی

یکی از موضوعات مطرح در حوزه ی پردازش تصویر و ویدئو در دهه گذشته، ردیابی و تشخیص نوع رفتار اشیا متحرک می باشد. توانایی استخراج اشیا متحرک و ردیابی آن در یک دنباله ی ویدئو، اولین گام در تحلیل ویدئوهای نظارتی است. روش های زیادی در خصوص اشیا متحرک و ردیابی آن ها مطرح شده است. روش رایج تشخیص اشیا متحرک، تفاضل پس زمینه است. از چالش های مطرح در حوزه ی ردیابی، می توان وجود اشیا مشابه در پنجره ی جستجو، ...

ردیابی لب و لب خوانی بااستفاده از پردازش تصاویر ویدیویی

لب خوانی از سالیان پیش یکی از موضوعات و ابزارهای مهم برای افراد کم شنوا و ناشنوا بوده تا این افراد درک مناسبی نسبت به گفته های شخصی که در حال صحبت کردن است داشته باشند. اخیر? لب خوانی با استفاده از تصاویر ویدیویی (تصاویر متوالی) یکی از موضوعات مورد علاقه محققان بوده که طی چند دهه اخیر تحقیقات گسترده ای راجع به این مساله انجام داده و مقاله های متعددی در این باره چاپ نموده اند، چرا که استفاده از...

15 صفحه اول

آشکارسازی و تعیین مکان متون فارسی - عربی در تصاویر ویدیویی

Video text detection plays an important role in applications such as semantic-based video analysis, text information retrieval, archiving and so on. In this paper, we propose a Farsi/Arabic text detection approach. First, with an appropriate edge detector, edges are extracted and then by using edges cross ponts, artificial corners are extracted. Artificial corner histogram analysis is done for ...

متن کامل

ردیابی وسیله نقلیه در دنباله تصاویر ویدیویی با وجود هم پوشانی

یکی از مسائل مهم و قابل توجه در سیستم های هوشمند و بینایی ماشین ردیابی اهداف است. هدف ما در این پایان نامه رهگیری مقاوم و موثر خودروهای مشاهده شده از دنباله تصاویر گرفته شده توسط دوربین ثابت است. شناسایی اهداف اولین مرحله در الگوریتم های ردیابی است. بدین منظور از روش های تفاضل پس زمینه استفاده نموده ایم. برای مدل کردن پس زمینه از روش های تفاضل فریم ها و تفاضل زمینه استفاده شده است. پس از به دست...

15 صفحه اول

آشکارسازی و تعیین مکان متون فارسی - عربی در تصاویر ویدیویی

استخراج اطلاعات متنی از تصاویر ویدیویی نقش مهمی را در کاربردهایی نظیر تحلیل معنایی ویدیو، بازیابی اطلاعات متنی، آرشیو تصاویر ویدیویی و اطلاعات مربوطه ایفا می کند. در این مقاله روشی جهت استخراج متن فارسی- عربی از تصاویر ویدیویی ارائه می گردد. در ابتدا با استفاده از آشکارساز لبه مناسب، لبه های موجود در تصویر استخراج گردیده و با استفاده از مکان تلاقی لبه ها، گوشه های تصنعی موجود در تصویر مشخص می ش...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی (نوشیروانی) بابل - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023